中国高端芯片:阿里平头哥自研5nmCPU性能超业界20%

倚天一出,谁与争锋?

5nm、单芯600亿晶体管、128核、主频3.2GHz……首战跑分就超出业内标杆20%,能效比提升50%以上。

这就是阿里平头哥半导体,在2021云栖大会现场交出的最新造芯成果。

取名倚天710,一颗自研云端芯片,刷新了Arm服务器芯片性能纪录。

更重要的是,这也是阿里平头哥成立以来,第一颗通用芯片。

以“生死看淡,不服就干”进军造芯3年来,平头哥先后推出了处理器IP玄铁910、AI推理专用芯片含光800,并且落到地商用。

但CPU,作为计算机系统最核心单元,无论难度还是重要性,意义如何强调都不为过。

在专用芯片含光800发布时,阿里巴巴集团CTO、达摩院院长张建锋谦虚表示:这是平头哥的万里长征第一步。

而现在,随着倚天710发布,通用芯片的成功拿下,毫无疑问标志着平头哥半导体来到了一个更大的里程碑节点——长征路上的艰难一役已被攻克。

同时,对于开启商业互联网向硬科技转型的阿里巴巴而言,亦是标志性时刻。

倚天710,一颗怎样的芯片?一颗通用服务器芯片(CPU),负责接收、处理、运算服务器计算机内部所有信息,是业内公认的设计难度最高的芯片之一。

但平头哥出手,选定的就是最具挑战的赛道。

倚天710采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的Arm v9架构,内含128核CPU,主频最高达到3.2GHz。

内存和接口方面,同样集成业界最领先的DDR5、PCIE5.0等技术,可以有效提升芯片的传输速率、适配云的不同应用场景。

在行业基础测试平台SPECInt2017上,跑分高达440,超出此前业界标杆20%,首战即巅峰。

而且性能巨兽还兼顾了功耗。

能效比相较业内标杆,实现了50%的优化,在数据中心应用中,节能减排意义不言自明。

没错,数据中心、云服务,将是倚天710的最核心商用场景。

作为一颗高性能服务器芯片,倚天710针对云场景的高并发、高性能和高能效需求而设计,把最前沿的芯片设计技术与云场景的独特需求相结合,最终实现了性能和能效比的突破。

比如云计算高并发条件下的带宽瓶颈,倚天710就对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。

这也是为什么倚天710一出,Arm赛道服务器CPU无人能与争锋关键原因。

Arm基础设施事业部全球副总裁邹挺就表示:

阿里巴巴作为公有云的头部厂商之一,为其他云服务提供商树立了可以效仿的标杆。

对Arm来说,平头哥在服务器处理器倚天710芯片的研发成果无疑是一项重大的里程碑,同时也验证了Arm IP在基础设施领域的产品路线图以及每瓦性能的优势。

我们为平头哥的技术团队感到高兴,期待继续与平头哥和阿里巴巴在芯片设计、软件应用优化以及生态孵化方面开展进一步深入的合作。

但即便成果如斯,阿里云智能总裁、达摩院院长张建锋,对倚天710强调更多的,还是客户第一。

他说,倚天710的发布,是基于阿里云“一云多芯”和“做深基础”的商业策略的结果,初心只是希望满足客户多样性的计算需求。

所以也是在这种策略之下,倚天710不选择对外出售,主要是阿里云自用,与自研AI推理芯片含光800一样,以云服务方式实现价值输出。

张建锋还表示,将继续与英特尔、英伟达、AMD、Arm等合作伙伴保持密切合作,为客户提供更多选择。

首款CPU如何炼成?平头哥不是上来就“敢”挑战通用芯片的。

在倚天710之前,平头哥先后交货RISC-V处理器玄铁910、首款专用芯片含光800,对于芯片设计和流片领域,已然不再是“新人”。

但即便如此,这也不代表可以轻而易举跨越——专用芯片到通用芯片的技术鸿沟。

如果将专用芯片类比为人类负责某一项能力的神经元,那么通用芯片,就好比大脑。

复杂性可见一斑。

所以哪怕半导体行业历史已然不短,但全球范围内,掌握CPU打造能力的半导体公司,也屈指可数。

可以明确的是,CPU是半导体行业设计门槛最高的芯片之一。

具体到数据中心领域,其CPU同样是业内公认最复杂的芯片之一,其架构设计复杂,对性能、功耗要求极高……

平头哥交货之前,全球只有Intel、AMD、AWS、华为等公司掌握这样的技术实力。

如果再算上制程、封装,以及性能和功耗,能者更加寥寥。

而平头哥不仅干了,还一干就瞄准顶级性能,挤爆牙膏,把服务器芯片带进5nm时代。

关于芯片的工艺,用其另一个名字“集成电路”,可以更好理解。

芯片,就是由大量晶体管组成的复杂电路,其中晶体管的栅极是最窄的线条,这个线条的宽度就代表了工艺的大小。

工艺越小,单位面积所能容纳的晶体管就越多,而芯片的性能也会越强,但这一数值越低,对技术的要求也越高。

在此之前,服务器芯片最先进的工艺仍为7nm,如果倚天710设计之初就定位7nm,可能会更稳妥。

但如果要挑战5nm,就得在能量密度、芯片内部结构布局等方面,有更多开创性的工作。

据说在研发过程中,平头哥团队光EDA软件调度就多达30多种,还度定制时钟网络和定制IP技术,此外采用了先进的多芯片堆叠技术,就为确保了芯片性能、功耗的优化。

为什么非要5nm?回答是:没得选。

平头哥方面解释,终端设备的寸土寸金,让外界更容易理解制程工艺之于CPU的重要性。

但易于忽略的是,用于服务器的高性能CPU,同样对制程工艺要求极高。

随着算力需求突飞猛进,对服务器CPU的性能要求也在水涨船高。

如果平头哥选择7nm,甚至退回10nm,不仅会导致面积上的增加,而且难于放下更多的Core……

另一方面,制程越先进,芯片越小,运营成本节省也会越多。

在数据中心领域,评价芯片有专门的重要维度叫TCO,即总拥有成本,所以数据中心芯片对于功耗异常敏感,更先进的制程,会在7×24小时运转运营中,节省更多的电力成本。

所以在研发过程中,“潜在客户”阿里云,就明确在性能、制程工艺和功耗方面,提出了更高的要求:

如果不能比现有方案更好,那就没有升级的必要。

如果不能比现有方案更强,也缺乏升级的说服力。

从这个维度来说,不难理解平头哥团队透露的“唯有最顶级才能生存”。

这不仅是自身产品能力的证明,更是平头哥商业化、可持续经营的题中之义。

与绝大多数芯片公司不同,平头哥的模式并非直接芯片对外售卖,而是服务云端,以阿里云对外输出,其最大客户就是阿里云。

但也是这种原因,让倚天710的首战即巅峰,多少有点制度优势的意味。

因为背靠阿里云这个全球前三的云平台,平头哥的云端芯片,从定义和设计之初,就比独立供应商更能深刻理解数据中心的业务场景和需求。

可以说是真正面向需求的芯片设计模式,最终追求的也是芯片即服务。

这也能解释,不论是AI推理芯片含光800,还是服务器CPU倚天710,为何都能有如此瞩目的性能提升。

不过值得注意的是,阿里平头哥的芯片推进,不光是这种性能上的纵深突破。

在本次云栖大会现场,另一则生态建设方向的软进展,同样可能影响深远——

平头哥方面正式宣布:开源玄铁RISC-V系列处理器,并开放相关工具及系统软件。

这也是发布玄铁910等处理器IP后,平头哥在RISC-V生态上的重要举措,成为了系列处理器与基础软件的全球首次全栈开源案例。

在玄铁910推出时,我们就介绍过“一个时代有一个时代的芯片”。

RISC-V架构因其开放、灵活的特性,有望成为继Intel x86、Arm后的下一代广泛应用的CPU架构。

但当前RISC-V架构面临的挑战也非常直接:应用碎片化、开发效率低、软硬件适配难等等。

归结起来就是,软硬件生态尚需更上一层楼。

而玄铁开源,可谓稳准狠出击,切中RISC-V生态发展刚需。

在AIoT领域中,平头哥自研推出的玄铁RISC-V系列处理器,覆盖从低功耗到高性能的各类场景,支持AliOS、FreeRTOS、RT-Thread、Linux、Android等操作系统,并已成功应用于微控制器、工业控制、智能家电、智能电网、图像处理、人工智能、多媒体和汽车电子等领域。

目前出货更是已超25亿颗,拥有超150家客户、超500个授权数,成为国内应用规模最大的国产CPU。

所以此时开源,生态拓展的目的,再明确不过。

而且对于观察平头哥,这同样是一则意义明确的风向标注脚:

这家2018年成立的半导体公司,雄心和价值,不会止于哪款芯片本身。

倚天710之后,再看平头哥?时间重回3年前,依然是云栖大会。

那年阿里巴巴官宣造芯投入最大升级,成立平头哥半导体公司。

外界都关注热议“生死看淡,不服就干”的平头哥精神,但对于阿里这次高调造芯的未来之路,并非没有质疑。

它是一个布局已久的决定。

从2016年阿里投资软件定义网络(SDN)芯片公司Barefoot,其后延展覆盖AI芯片、物联网芯片等领域,将翱捷科技、寒武纪、深鉴、耐能(Kneron)、中天微、恒玄科技等纳入旗下。

同时达摩院中,组建起一支由半导体行业的工业界和学术界顶级专家组成的技术团队,研究方向全面涵盖系统架构、计算技术、存储技术以及芯片工程等核心芯片设计技术,然后成立平头哥后,率先在AI专用芯片领域取得成果。

但平头哥的推进,依然被认为是一次过于大胆的跨界尝试。

即便全球范围内,也还没有哪家公司,能够短短数年内,完成专用芯片到通用芯片的跨越。

所以倚天710交货,不仅是平头哥已具备复杂大芯片设计能力的证明,也是阿里造芯标志性一役。

如果说AI专用芯片含光800的发布,被视为万里长征第一步。

那通用芯片倚天710,则表明阿里造芯的长征行军,完成关键一役。

现在平头哥交出的成果和芯片能力证明,足以跻身顶级半导体公司序列。

其次,这同样也是22岁阿里巴巴的历史性时刻。

在阿里内部,2009年成立阿里云、启动飞天操作系统,被看作探索前沿科技的开端。

然而过去10年来,阿里的成功,更多被认为是商业上的成功、运营上的成功,而不是科技实力上的成功。

直到2017年达摩院推出,包含AI、量子计算、自动驾驶、芯片和5G等前沿技术领域探索被明确,才让人感知到商业巨头面向硬科技转身的强烈决心。

而平头哥半导体,就是这种转型努力的集大成者。

在最硬核、最底层的芯片半导体领域,从发布RISC-V玄铁处理器,到发布AI芯片含光800、通用服务器芯片倚天710,平头哥三年完成“三级跳”。

这种跨越并不容易,但正是这种难,方能证明前进方向的必要性和正确性。

幸运的是,阿里再次用成果说话,把相信变成了看见。

所以倚天710交货,同样也是阿里硬科技再上新台阶,从商业公司向硬科技公司转身的标志性时刻。

当然,这甚至不止于阿里一家公司本身。

过去几年风风雨雨里,中国在芯片领域面临的客观现实,震惊了所有人,教育了所有人。

中国最大的出口商品是什么?

品类有争论。

但中国最大的进口商品是什么?

答案有且只有一个:芯片半导体。

尽管在芯片设计领域,不同的力量正在快马加鞭补足短板。

但高性能CPU市场,建树有限,始终处于落后待供应状态。

而现在,5nm倚天710一出,局面得到根本性扭转,在高性能服务器芯片领域,新的标杆和灯塔,日出东方。

这或许也是阿里平头哥团队,将这款芯片以倚天来命名的原因。

有意思的是,自交货以来,平头哥团队就选取中国上古和武侠中的“神兵利剑”成为每一款产品的江湖代称。

玄铁是“重剑无锋,大巧不工”的处理器IP。

含光是“视不可见,无往不利”的AI专用芯片。

而倚天……首款CPU芯片。

倚天一出,谁与争锋?!


倚天出鞘!600亿晶体管,阿里服务器CPU来了,巨头造芯战升级

基于“一云多芯”策略,阿里持续扩张芯版图。作者 |  心缘编辑 |  漠影芯东西10月19日报道,刚刚,在2021云栖大会主论坛现场,阿里巴巴旗下半导体公司平头哥推出自研云原生处理器芯片倚天710,采用5nm工艺,单芯片容纳高达600亿晶体管。这是业界性能最强的Arm服务器芯片,性能超过业界标杆20%,能效比提升50%以上。

作为阿里第一颗为云而生的CPU芯片,倚天710无疑是阿里云推进“一云多芯”策略的重要一步,将于阿里云数据中心部署应用,率先在今年双11应用,并逐步服务云上企业。至此,阿里成为继亚马逊、华为后,全球第三家拥有自研Arm服务器芯片的云计算厂商。除了进军服务器芯片外,阿里平头哥还宣布玄铁CPU已出货超25亿颗,成为国内应用规模最大的国产CPU,并宣布开源其玄铁RISC-V系列处理器,开放相关工具及系统软件。

01.业界首款5nm服务器芯片:128核、600亿晶体管

阿里云智能总裁、达摩院院长张建锋说,基于阿里云“一云多芯”和“做深基础”的商业策略,平头哥发布倚天710,以满足客户多样性的计算需求。这款CPU针对云场景的高并发、高性能和高能效需求而设计,将领先的芯片设计技术与云场景的独特需求相结合,基于最新ARMv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和能效比。这也是业界第一颗采用5nm工艺的服务器芯片,单芯片容纳高达600亿个晶体管。由于5nm工艺对能量密度、芯片内部结构的布局要求极高,平头哥在研发过程中灵活调度多达30种不同EDA软件、深度定制时钟网络和定制IP技术,并采用了先进的多芯片堆叠技术,以确保芯片性能、功耗的优化。

在内存和接口方面,倚天710集成了业界先进的DDR5、PCIE5.0等技术,可有效提升芯片的传输速率,并适配云的不同应用场景。为了解决云计算高并发条件下的带宽瓶颈,倚天710针对片上互联进行了特殊优化设计,通过全新的流控算法,有效缓解系统拥塞,从而提升了系统效率和扩展性。在全球权威CPU基准测试集SPECint2017上,倚天710的分数达到440,超出业界标杆20%,能效比优于业界标杆50%以上,能有效帮助数据中心节能减排。

张建锋说,阿里在全球管理着超过150万台服务器。而成功自研云端芯片,不仅有助于降低阿里巴巴集团内部整体计算的成本,还能通过阿里云向外输出,带给云上客户更高性价比的选择。

02.倚天710亮剑背后,Arm吹响冲锋号角

通用处理器芯片是数据中心最复杂的芯片之一,其架构设计之复杂、技术难度之高,致使多年以来,掌握这一技术实力的企业屈指可数。全球三大指令集架构中,x86俨然是服务器芯片市场的主宰者,x86霸主英特尔长期占据主导地位,另一位x86核心玩家AMD亦在近年异军突起。但过去三年间,市场格局开始发生变动——Arm向服务器市场吹起了冲锋的号角。2018年10月,Arm宣布将推出一款专为云数据中心、边缘计算及5G网络市场而打造的全新品牌——Neoverse系列服务器处理器,并逐步完善V、N、E三大系列产品路线图。日益增长的Arm服务器处理器IP核性能,递给了云计算厂商有力的造芯武器。2018年11月,全球第一大云服务商亚马逊AWS推出基于Arm架构的首款AWS Graviton服务器芯片;2019年1月,华为推出基于Arm架构的7nm 64核服务器芯片鲲鹏920;2019年12月,亚马逊AWS推出采用Arm Neoverse N1内核的7nm第二代Graviton服务器芯片。独立服务器芯片供应商也抓住这一机遇。2018年成立的安晟培半导体(Ampere Computing)在2020年6月公布业界首款拥有128核CPU的Arm服务器芯片Ampere Altra Max。在国内,飞腾已基于Arm架构研发多代服务器芯片。

尽管倚天710“出鞘”稍晚,但无论是业界首发5nm还是创新架构设计,都展现了平头哥研发设计大型复杂芯片的能力。按照公开信息,Ampere和飞腾均计划在明年上新5nm服务器芯片。与其他自研芯片的云厂商类似,倚天710不会出售,主要是阿里云自用。阿里云已全面兼容x86、Arm、RISC-V等主流芯片架构,自研倚天710进一步丰富了阿里云的底层技术架构,并与飞天操作系统深度协同,为云上客户提供高性价比的云服务。阿里云智能总裁、达摩院院长张建锋表示:“我们将继续与英特尔、英伟达、AMD、Arm等合作伙伴保持密切合作,为客户提供更多选择。”

对于阿里云自身而言,倚天710的问世,意味着从底层芯片、云操作系统到存储、网络、数据库系统,阿里云已经实现全栈自研。

03.“一云多芯”策略加持,阿里持续扩张芯版图

在业界,阿里自研芯片早已不算新鲜事。自2016年11月投资软件定义网络(SDN)芯片公司Barefoot起,阿里便开始展露布局芯片的雄心,陆续投资翱捷科技、寒武纪、深鉴、耐能、中天微、恒玄科技等芯片公司,覆盖AI芯片、物联网芯片等多领域。2017年10月,阿里成立达摩院,随后迅速组建了一支由半导体行业工业界和学术界顶级专家组成的技术团队,开始专攻核心芯片设计技术。2018年,阿里巴巴全资收购大陆唯一拥有自主嵌入式CPU IP核的半导体公司中天微,并在数月后将达摩院芯片研发团队与中天微团队合并成立平头哥半导体公司。三年之间,平头哥完成了从发布首款RISC-V处理器玄铁710、首款云端AI推理芯片含光800到首款通用服务器芯片倚天710的“三级跳”。而此前积累的AI芯片及处理器IP设计经验,也成为平头哥突破通用芯片研发技术的基础。在处理器IP方面,平头哥累计开发了十多款基于RISC-V架构的玄铁系列嵌入式CPU IP核,这些为AIoT终端芯片提供的高性价比IP产品均已得到大规模量产的验证,覆盖从低功耗到高性能的等机器视觉、工业控制、车载终端、移动通信、多媒体和无线接入各类场景,累计出货量超过25亿颗,拥有150余家客户、超500个授权数,已成为国内应用规模最大的国产CPU。继发布玄铁710等处理器后,平头哥今日宣布其在RISC-V生态上又一重要举措——开源四款玄铁RISC-V系列处理器,覆盖高、中、低应用场景,并开放相关工具及系统软件。全球开发者可通过平头哥Github和芯片开放社区下载玄铁源代码,平头哥也将持续开源稳定的、全栈一体的RISC-V IP核,并提供技术支持和应用服务。

这是系列处理器与基础软件的全球首次全栈开源,将进一步拉近了RISC-V技术与开发者的距离,加速生态进步和创新落地。在云端芯片方面,背靠全球前三、亚洲第一的云平台阿里云,平头哥在深刻理解数据中心业务场景和需求方面具备天然优势。阿里第一颗云端AI推理芯片含光800已实现规模化应用,通过阿里云服务了搜索推荐、视频直播等行业客户。达摩院、平头哥及阿里云正成为阿里巴巴三位一体的核心技术栈。随着倚天710的发布,平头哥已拥有处理器IP、AI芯片及通用芯片等产品家族,其端云一体化战略愈发清晰。

04.结语:云巨头造芯序幕拉开

打造高性价比的自研云端芯片,已是近年多家云计算巨头重点发力的方向。通过自研芯片,云服务商能结合自身场景需求,为客户提供更丰富的选择,以及更高性价比的软硬件协同方案。与此同时,基于Arm架构的服务器芯片在技术、性能、生态系统方面都日益成熟,这给云厂商自研芯片提供了便利的土壤。随着Arm的士气一路猛涨,服务器芯片格局逐渐趋于多元化。而以亚马逊AWS、阿里云为代表的云厂商们,正通过不断汇聚优质芯片设计人才及技术资源,成为Arm服务器扩张疆域的生力军。


中国高端芯片新突破:阿里巴巴自研5nmCPU 性能超业界20%

中国半导体行业虽发展落后却充满活力。在正在举办的2021云栖大会上,阿里巴巴推出使用5nm工艺的自研通用服务器芯片“倚天710”,引发关注。

中共党报《人民日报》10月19日报道上述消息,并发文称赞,“面对‘卡脖子’领域,越来越多中国企业投身科研迈出了探索步伐。在实现科技自立自强的‘技术长征’路上,期待更多中国企业、社会力量加入科技创新的星辰大海”。

10月19日,在2021云栖大会现场,阿里巴巴旗下半导体公司平头哥发布自研云芯片“倚天710”。

据官方介绍,该芯片是业界性能最强的ARM服务器芯片,性能超过业界标杆20%,能效比提升50%以上。它采用业界最先进的5nm工艺,单芯片容纳高达600亿晶体管;在芯片架构上,基于最新的ARMv9架构,内含128核CPU,主频最高达到3.2GHz,能同时兼顾性能和功耗。在内存和接口方面,集成业界最领先的DDR5、PCIe5.0等技术,能有效提升芯片的传输速率,并且可适配云的不同应用场景。

据称“倚天710”是阿里第一颗为云而生的CPU芯片,将在阿里云数据中心部署应用。

中国半导体行业发展较其他行业来说较为落后。其与日韩起步时间大致相同,但是经过几十年的发展却落后日韩30年。

多维新闻10月3日在《芯片缺货拐点未至 中国半导体三大预测能否成真?》中指出,放眼整个半导体全产业链来说,中国国内的半导体企业在整个上下游的市场份额以及全球位置方面,仍然处于较低的水平,尤其是设备、材料技术障碍非常高的产业上游。

在封装测试、光电器件、传感器和分立器件、晶圆制造上,中国的市场份额均达到两位数,还是非常可观的。FAB(半导体制造厂)差不多占10%的份额,封装测试占比最高达20%,但其面临的问题是如何向先进封装进行拓展。

总部位于美国的半导体研究公司Gartner、上海代表处副总裁盛陵海指出,现阶段,国内还是缺少如士兰微这样的IDM类型的公司。(IDM模式指从设计、制造、封装测试到销售自有品牌IC都一手包办的半导体垂直整合型公司。)

实际上,中国从五年前开始就已在半导体自由化方面付诸了很多努力,Gartner也因此对中国市场的现状进行了一系列预测。

第一个预测,是在2025年,中国半导体公司在国内市场将有机会从当下15%的份额突破到30%。第二个预测,是前十的中国半导体购买者基本上是电子制造企业,OEM或者是ODM。目前,中国国内排名前十的电子产品制造企业均拥有自主芯片设计的能力,OPPO、小米、美的、百度、阿里巴巴等企业都已在建立自己的团队。

第三个预测,是相比2020年,中国半导体市场的投资规模在2023年会实现80%的增幅。主要原因源于中芯国际、长鑫存储、长江存储,以及其它一些新兴的中小规模晶圆工厂投资。在2023年,投资规模将有机会达到一个可观的峰值。

推荐阅读